期刊
  出版年
  关键词
结果中检索 Open Search
Please wait a minute...
选择: 显示/隐藏图片
1. 基于分布和逆文本类别指数的特征迁移加权算法
邱云飞, 刘世兴, 林明明, 邵良杉
计算机应用    2015, 35 (6): 1643-1648.   DOI: 10.11772/j.issn.1001-9081.2015.06.1643
摘要460)      PDF (908KB)(342)    收藏

传统机器学习面临一个难题,即当训练数据与测试数据不再服从相同分布时,由训练集得到的分类器无法对测试集文本准确分类。针对该问题,根据迁移学习原理,在源领域和目标领域的交集特征中,依据改进的特征分布相似度进行特征加权;在非交集特征中,引入语义近似度和新提出的逆文本类别指数(TF-ICF),对特征在源领域内进行加权计算,充分利用大量已标记的源领域数据和少量已标记的目标领域数据获得所需特征,以便快速构建分类器。在文本数据集20Newsgroups和非文本数据集UCI中的实验结果表明,基于分布和逆文本类别指数的特征迁移加权算法能够在保证精度的前提下对特征快速迁移并加权。

参考文献 | 相关文章 | 多维度评价
2. 基于二维坐标映射法的消费情感分类方法
林明明 邱云飞 邵良杉
计算机应用    2014, 34 (9): 2571-2576.   DOI: 10.11772/j.issn.1001-9081.2014.09.2571
摘要188)      PDF (1043KB)(411)    收藏

针对中文消费评论的情感分类问题,构建了一种基于语料库的二维坐标映射法的情感分类方法。根据中文语言特点,首先提出了基于语料库的搜索方法,使搜索更有针对性;其次,定义了提取表达情感的中文短语的规则;第三,构造了某领域的最佳种子词选取算法;最后,构造了二维坐标映射算法,通过计算评论句子的坐标值,将其映射到二维直角坐标系中,判断句子的语义倾向性。选取亚马逊网站某商家1200条与牛奶相关的评论(好、差评各600条)进行实验,首先根据最佳种子词选取算法选取“很好漏”作为最佳种子词,再根据二维坐标映射算法判断评论的情感极性,实验的平均F值达到了85%以上。实验结果表明该算法可以对消费评论进行情感分类。

参考文献 | 相关文章 | 多维度评价
3. 基于三维坐标的消费情绪本体库建立及应用
邱云飞 林明明 邵良杉
计算机应用    2013, 33 (09): 2540-2545.   DOI: 10.11772/j.issn.1001-9081.2013.09.2540
摘要557)      PDF (925KB)(669)    收藏
针对商家好评中存在非真正满意的评价问题,构建一种能够真正反映消费者情绪状态的方法,以减少好评率中非真正满意的评价。针对消费情绪进行了研究,首先从评价中提取出消费情绪词汇,根据消费情绪的特征,将消费情绪划分为7大类,25小类,建立了三维坐标模型;其次,用Protégé来构建消费情绪本体库,根据三维坐标词汇分类算法对消费情绪词汇进行自动划分;然后,根据构建的本体库,用消费情绪判断算法来自动判断消费者的评价。最后,与淘宝的好评率进行比较,F值达到了95%以上,减少了好评中非真正满意的评价,体现了消费者的真实情绪。
相关文章 | 多维度评价